AFFIDABILITA’ DI STIME DELLA MEDIA DA GRANDI CAMPIONI

USEREMO LA DISTRIBUZIONE NORMALE PER DETERMINARE L'AFFIDABILITA' DI STIME DA CAMPIONI DELLA MEDIA PARAMETRICA FACCIAMO UN ESEMPIO AVVALENDOCI DEI DATI OTTENUTI PER IL PESO (in g) DI DUE POPOLAZIONI (N=15) AVENTI CIASCUNA PESO MEDIO PARAMETRICO DI 3 g . LE MISURE SONO DI DIFFICILE ATTUAZIONE E SI RIESCE A OTTENERE MISURE SOLO PER POCHI CAMPIONI DA CIASCUNA POPOLAZIONE. TIPICAMENTE OTTENIAMO CAMPIONI DI 3 ELEMENTI PER VOLTA DA CIASCUNA POPOLAZIONE. 

.

P1

3

2

3

4

3

3

4

3

2

3

3

3

2

4

3

P2

12

1

1

6

2

1

4

2

2

1

2

3

1

2

5

 

IL SENSO COMUNE CI DICE CHE CI SONO PIU' PROBABILITA' DI AVERE UNA BUONA STIMA DI QUESTO PARAMETRO DAL CAMPIONE PRESO DALLA POPOLAZIONE P1 PIUTTOSTO CHE DAL CAMPIONE ESTRATTO DALLA POPOLAZIONE 2

GIUNGIAMO A QUESTA CONCLUSIONE SULLA BASE DELL'OSSERVAZIONE CHE LA VARIAZIONE NELLA POPOLAZIONE 2 E' EVIDENTEMENTE PIU' GRANDE DI QUELLA NELLA POPOLAZIONE 1

UNA STIMA PUNTUALE DELLA MEDIA DELLA POPOLAZIONE NON HA GRANDE RILEVANZA A MENO CHE NON ABBIAMO QUALCHE IDEA SULL'AFFIDABILITA' DELLA STIMA.

PER AFFIDABILITA' INTENDIAMO QUANTO LA NOSTRA STIMA SI AVVICINA AL VALORE PARAMETRICO

SE NON POSSIAMO CONOSCERE IL VERO VALORE DELLA MEDIA PARAMETRICA COME FACCIAMO A SAPERE DI QUANTO CI SIAMO AVVICINATI AD ESSO?

POSSIAMO FARLO CONSIDERANDO CHE:

SE L'EFFETTO DELLA VARIAZIONE E' PICCOLO ALLORA POSSIAMO ESSERE PIU' SICURI CHE LA NOSTRA STATISTICA CAMPIONARIA SARA' VICINA AL PARAMETRO DELLA POPOLAZIONE.

VEDIAMO ORA COME E' POSSIBILE DARE UN VALORE NUMERICO ALLA AFFIDABILITA’ DI CUI STIAMO PARLANDO: MISURE DI LUNGHEZZE IN mm DI 230 CRISALIDI(MOSCHE)

UEEE

USEREMO LA DISTRIBUZIONE NORMALE PER TRATTARE CON QUESTI DATI - C'E' DA CHIEDERSI QUINDI SE I DATI SONO STATI ESTRATTI DA UNA DISTRIBUZIONE NORMALE PER RISPONDERE CI SONO TEST STATISTICI CHE CONSIDEREREMO PIU' AVANTI, PER ORA DIAMO UNO SGUARDO AL GRAFICO PER PUNTI DEI DATI E VEDIAMO SE APPROSSIMA LA FORMA DI UNA CURVA A CAMPANA. M

M
IL NOSTRO CAMPIONE
SEMBRA SIA STATO PRESO DA UNA POPOLAZIONE DISTRIBUITA NORMALMENTE

DAL CAMPIONE STIMIAMO CHE LA MEDIA PARAMETRICA SIA 6.126 E LA DEVIAZIONE STANDARD PARAMETRICA 0.2628

LA DISTRIBUZIONE NORMALE CON UNA MEDIA DI 6.1626 E UNA DEVIAZIONE STANDARD DI 0.2628 E’ RIPORTATA NELLA FIGURAM

 
 
IN UNA DISTRIBUZIONE NORMALE - INDIPENDENTEMENTE DALLA MEDIA O DAL GRADO DI PIATTEZZA DELLA CURVA - IL 95% DEI VALORI DELLA POPOLAZIONE SI TROVERA' CON DEVIAZIONI STANDARD DALLLA MEDIA TRA PIU' O MENO 1.96

LA DEVIAZIONE STANDARD E' 0.2628.

1.96 × 0.2628 = 0.5151 

LA MEDIA E' 6.1626

6.1626 - 0.5151 = 5.6457

6.1626 + 0.5151 = 6.6777

 

IL 95% DELLA ZONA SOTTO LA CURVA NEL GRAFICO SI TROVA TRA 5.6475 E 6.6777.

SE MISURIAMO UNA CRISALIDE DI MOSCA E TROVIAMO CHE E' LUNGA 5.01 mm

LA CRISALIDE VIENE DALLA POPOLAZIONE DESCRITTA DALLA POPOLAZIONE I CUI PARAMETRI SONO STATI STIMATI DAI DATI NEL NOSTRO ESEMPIO?

 

  1. STABILIAMO IL LIVELLO DI SIGNIFICATIVITA’ AL 5% (0.05).
  2. STABILIAMO COME VOSTRA IPOTESI NULLA:

NON C'E NESSUNA DIFFERENZA SIGNIFICATIVA TRA LA LUNGHEZZA DELLA CRISALIDE E LA MEDIA DELLA POPOLAZIONE DI 6.1626 mm.

SI DOVREBBE RIGETTARE L'IPOTESI NULLA POICHE' C'E' UNA POSSIBILITA' DEL 5% O MENO DI OTTENERE UN RISULTATO TANTO LONTANO DALLA MEDIA PARAMETRICA.

DOVREMMO RIGETTARE L'IPOTESI NULLA PER TUTTE LE MISURE DELLA CRISALIDE L FUORI DALL’INTERVALLO

5.6475£ L £ 6.6777

AD UN LIVELLO DI SIGNIFICATIVITA’ DI 0.05.

 

 

SUPPONENDO DI CONOSCERE I VERI PARAMETRI DELLA POPOLAZIONE DELLE NOSTRE CRISALIDI:

1. PRENDIAMO 100 GRUPPI DI CAMPIONI CON 230 CRISALIDI PER CIASCUN GRUPPO.  QUESTO IMPLICA UN TOTALE DI 23.000 SINGOLE MISURE.

2. CALCOLIAMO LA MEDIA CAMPIONARIA DI CIASCUN GRUPPO.

3. ORA ABBIAMO UNA LISTA DI 100 MEDIE - PRIMA AVEVAMO UNA LISTA DI 230 SINGOLE MISURE.

4. CALCOLIAMO LA MEDIA DI QUESTE MEDIE. QUESTO VALORE DOVREBBE ESSERE VICINO A 6.1626

  1. CALCOLIAMO LA

DEVIAZIONE STANDARD DI QUESTA MEDIE.

LA DEVIAZIONE STANDARD DI QUESTE MEDIE E' CHIAMATA

ERRORE STANDARD DELLA MEDIA O SEMPLICEMENTE ERRORE STANDARD.

E' POSSIBILE DIMOSTRARE MATEMATICAMENTE CHE C'E' UNA RELAZIONE TRA LA DEVIAZIONE STANDARD DI UN CAMPIONE DI GRANDEZZA n E L'ERRORE STANDARD PER CAMPIONI DELLA STESSA MISURA.

L'ERRORE STANDARD PER CAMPIONI DI MISURA n E' UGUALE ALLA DEVIAZIONE STANDARD DIVISO LA RADICE QUADRATA DI n.

LA FORMULA PER L'ERRORE STANDARD PARAMETRICO E’:

 

 

LA FORMULA PER L’ERRORE STANDARD DEL CAMPIONE E’ :
M

 

L’ERRORE STANDARD DEL CAMPIONE PER I NOSTRI DATI SARA’:
M

M

M

0.0173 E' UNA STIMA DELL'ERRORE STANDARD PARAMETRICO.

 E' POSSIBILE TROVARE QUESTO VALORE IN SEMean RIPORTATO PER LA STATISTICA DESCRITTIVA DELLA TABELLA DI DATI OTTENUTA DALLE NOSTRE MISURE
M

 
 
 
 
 

UNA PROVA DELLA RELAZIONE ESISTENTE TRA LA DEVIAZIONE STANDARD E L'ERRORE STANDARD E’ FORNITA DA UN TEOREMA MOLTO IMPORTANTE IN STATISTICA :

IL TEOREMA DEL LIMITE CENTRALE

MAN MANO CHE LA GRANDEZZA DEL CAMPIONE AUMENTA, LE MEDIE DEI CAMPIONI PRESE DALLA POPOLAZIONE DI QUALUNQUE DISTRIBUZIONE (NORMALE O NON), A VARIANZA FINITA, TENDERA’ AD UNA DISTRIBUZIONE NORMALE.

LE 100 MEDIE DEI NOSTRI GRUPPI DI CAMPIONI DI 230 VALORI CIASCUNO SI DOVREBBERO AVVICINARE AD UNA DISTRIBUZIONE NORMALE.

LA DEVIAZIONE STANDARD DI QUESTA DISTRIBUZIONE NORMALE DI VALORI MEDI,  IN QUANTO OPPOSTA A DATI INDIVIDUALI, SARA' STIMATA DALL'ERRORE STANDARD DEL CAMPIONE.
 
 

 

 

POPOLAZIONE DISTRIBUITA NORMALMENTE CON UNA MEDIA DI 6.1626 E UNA DEVIAZIONE STANDARD DI 0.2628  ( CURVA ROSSA )

DISTRIBUZIONE NORMALE DELLE MEDIE PER CAMPIONI DI 230 PRESI DA QUESTA POPOLAZIONE ( CURVA BLU ).
 

 

NOTIAMO CHE:

  1. LE MEDIE DELLE DUE DISTRIBUZIONI SONO LE STESSE.

2.  POICHE' L'ERRORE STANDARD VIENE CALCOLATO DIVIDENDO LA DEVIAZIONE STANDARD DEI DATI PER LA RADICE QUADRATA DELLA GRANDEZZA DEL CAMPIONE - IL GRAFICO DELLE MEDIE HA PUNTA PIU' "APPUNTITA" E MOSTRA UNA VARIAZIONE MOLTO MINORE.

SE AVESSIMO UNA POPOLAZIONE CON UNA MEDIA PARAMETRICA DI 6.1626, UNA DEVIAZIONE PARAMETRICA STANDARD DI 0.2628,  E PRENDESSIMO UN NUMERO INFINITO DI CAMPIONI DI 230, ALLORA IL 95% DELLE MEDIE DI QUESTI CAMPIONI CADREBBE TRA UN VALORE DI 6.1287 E 6.1965.

 

COME FACCIAMO A SAPERLO?

 

 

 

 

 

DALL'ERRORE STANDARD:
M

M

6.1626 - ( 1.96 × 0.0173) = 6.1287

6.1626 + ( 1.96 × 0.0173) = 6.1965

 

OGNI MEDIA CAMPIONE DA UN CAMPIONE CASUALE DI 230 CRISALIDI DI QUESTA POPOLAZIONE AVRA' UNA PROBABILIA' DEL 95% DI ESSERE ENTRO ± 1.96 × 0.0173 DALLA MEDIA PARAMETRICA 

IL 95% DELLE MEDIE CAMPIONARIE VERRA' A TROVARSI IN QUESTO INTERVALLO - UN INTERVALLO CHIAMATO

INTERVALLO DI CONFIDENZA DEL 95%

LA FORMULA PER L’ INTERVALLO DI CONFIDENZA DEL 95% BASATA SULLA MEDIA PARAMETRICA E SULLA DEVIAZIONE STANDARD E’ DATA DA:

 

 

LA FORMULA BASATA SULLA MEDIA CAMPIONE E DEVIAZIONE STANDARD:

 

SE CALCOLIAMO LE MEDIE E GLI ERRORI STANDARD PER UN GRANDE NUMERO DI CAMPIONI, ACCETTEREMO IL 95% DEGLI INTERVALLI CALCOLATI DALLA SUCCITATA FORMULA PER MISURARE L'ERRORE PARAMETRICO.
M

M

LA MEDIA PARAMETRICA ILLUSTRATA E' 0 E LE LINEE VERTICALI RAPPRESENTANO LO SCARTO MISURATO DALLA MEDIA ± 1.96 × s /Ö n .

CI DOVREMO ASPETTARE CHE IL 95%  DEGLI SCARTI STIA ATTORNO ALLO ZERO .

ORA ABBIAMO UNA MISURA NUMERICA DELL'AFFIDABILITA' DELLA NOSTRA MEDIA CAMPIONE COME UNA STIMA DELLA MEDIA PARAMETRICA.

QUESTO INTERVALLO DI ± 1.96 × s /Ö n DIVENTERA' PIU' PICCOLO MAN MANO CHE CRESCE LA GRANDEZZA DEL CAMPIONE E DARA' UN MAGGIOR GRADO DI CERTEZZA A SECONDA DI DOVE LA MEDIA PARAMETRICA VIENE TROVATA.

M

M
LA FORMULA E' UNO
STIMATORE DI INTERVALLO POICHE' USA DATI DAI CAMPIONI PER DETERMINARE UN INTERVALLO CON UNA PROBABILITA' NOTA DI MISURARE LA DISPERSIONE DI UN PARAMETRO.

IL VALORE DI PROBABILITA’ ASSOCIATO A QUESTA FORMULA E' DETERMINATO DAL VALORE 1.96. UN COEFFICIENTE DI CONFIDENZA RAPPRESENTA LA PROBABILITA' CHE LO STIMATORE DI INTERVALLO INCLUDA IL PARAMETRO. IN QUESTO CASO IL VALORE DEL COEFFICIENTE DI CONFIDENZA E' 0.95.

SE ESPRIMIAMO IL COEFFICIENTE DI CONFIDENZA COME UNA PERCENTUALE - ABBIAMO UN LIVELLO DI CONFIDENZA CHE IN QUESTO CASO E' IL 95%.
 

 

 

 

 

 

IPOTESI NELL’USO DELL’INTERVALLO DI

CONFIDENZA DEL 95%

  1. SE STATE USANDO DATI SINGOLI
  2. E STATE CONFRONTANDO UN VALORE CON

    LA MEDIA DI QUESTI VALORI - PER USARE UN MODELLO BASATO SULLA DISTRIBUZIONE

    NORMALE, I DATI DEVONO AVVICINARSI AD UNA DISTRIBUZIONE NORMALE. 

  3. SE STATE USANDO LE MEDIE DEI DATI- I DATI

STESSI NON DEVONO AVERE UNA DISTRIBUZIONE

NORMALE MA LA DIMENSIONE DEL CAMPIONE

DEVE ESSERE ABBASTANZA GRANDE COSI' CHE

LE MEDIE APPROSSIMERANNO AD UNA

DISTRIBUZIONE NORMALE. 

UN CAMPIONE DI 30 O PIU' VIENE DI SOLITO CONSIDERATO " ABBASTANZA GRANDE "

 

 

 

COMPITI 

1. IN TABELLA SONO RIPORTATI I PESI IN g DI TOPI

 

 

I DATI SONO STATI VERIFICATI E SI E' VISTO CHE RIENTRANO IN UNA DISTRIBUZIONE NORMALE.

1. FARE UN GRAFICO PER PUNTI

2.  ESEGUIRE LA STATISTICA DESCRITTIVA DI QUESTO CAMPIONE

3.  DETERMINATE L'INTERVALLO DOVE LA MEDIA PARAMETRICA HA PROBABILITA' DEL 95% DI ESSERE TROVATA.

3. INTERVALLI DI CONFIDENZA

USATI PER UNA DISTRIBUZIONE NORMALE.
   

INTERVALLO DI CONFIDENZA

k

90%

1.64

95%

1.96

99%

2.58

.

 

CALCOLATE GLI INTERVALLI DI CONFIDENZA DOVE LA MEDIA PARAMETRICA HA UNA PROBABILITA' DEL 90% E 99%  DI ESSERE TROVATA PER I DATI DEI TOPI.

COSA ACCADE ALLA MISURA DEL VOSTRO INTERVALLO MAN A MANO CHE CRESCE IL LIVELLO DI CONFIDENZA?

QUAL'E' L’EFFETTO DI UN LIVELLO DI CONFIDENZA PIU' ALTO?

COME E' POSSIBILE MANTENERE UN ALTO LIVELLO DI CONFIDENZA E ABBASSARE IL RANGE DELL’ INTERVALLO DI CONFIDENZA

4. ASSUMIAMO DI AVERE UNA POPOLAZIONE CON UNA MEDIA PARAMETRICA DI 108 E UNA DEVIAZIONE STANDARD PARAMETRICA DI 23.

STIAMO CAMPIONANDO DA CIO’ CHE NOI PENSIAMO SIA LA POPOLAZIONE.

1. SE LA DIMENSIONE DEL CAMPIONE E' 100,  DOVE DEVE CADERE LA MEDIA DEL CAMPIONE COSI' CHE SI POSSA CONCLUDERE CHE IL CAMPIONE VIENE DALLA POPOLAZIONE CON IL 95% DI INTERVALLO DI CONFIDENZA (LIVELLO DI SIGNIFICATIVITA’ DEL 5%)?

 

2. SE LA DIMENSIONE DEL CAMPIONE E' 1000, DOVE DEVE CADERE LA MEDIA DEL CAMPIONE COSI' CHE SI POSSA CONCLUDERE CHE IL CAMPIONE VIENE DALLA POPOLAZIONE CON IL 95% DI INTERVALLO DI CONFIDENZA?